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摘 要 : 论文 查 重 对 高 校 的 毕业 论文 质量 管控 的 过 程 是 有 其 必要 性 的 。 提 出 一 种 新 型 综合 性 作法 ， 针 对 互联 网 的 查 重 
系统 过 程 过 于 极端 的 状况 下 ， 可 以 使 用 此 方法 检测 出 异常 ， 才 会 要 求 再 次 以 人 工 检 测 。 目 标 是 要 减少 误 判 ， 将 原本 不 
是 抄袭 却 被 判定 抄袭 的 论文 得 到 申 履 的 机 会 。 当 同一 篇 论文 在 不 同 的 查 重 网 站 中 检测 出 的 重复 率 相 差 较 大 时 ， 采 用 论 
文 新 型 综合 性 查 重 方法 ， 在 判定 论文 最 后 的 重复 结果 中 加 入 人 为 判断 的 权重 ， 降 低 论 文 重 复 率 被 网 站 所 控制 的 因素 ， 
使 得 查 重 结果 不 完全 被 网 站 或 人 工控 制 ， 这 种 网 站 人 工 的 双重 混合 式 检测 弥补 了 网 站 资源 库 问题 对 查 重 结果 产生 的 影 
响 ， 提 升 论 文 查 重 结果 的 准确 性 和 可 信 度 。 

关键 词 : 毕业 论文 ; 查 重 网 站 ; 人 工 检测 ; 旭 穷 

中 图 分 类 号 : TP391 doi: 10.3969/j.issn.1001-3695.2018.03.0156 


| 


Comprehensive weight checking method for graduation thesis 


Xie Zhaoxian, Ye Shuzheni, Huang Shenquan 
(School of mechanical & electrical engineering, Wenzhou University, Wenzhou Zhejiang 325035. ) 


Abstract: It is necessary for the quality control process of university graduation thesis to check papers repetition rate. Due to 
the requirements of detecting repetition rate, most of them can only do the similar proportion and quantity simply by manual 
examination or by the Internet. In this paper, it proposes a new comprehensive approach including the manual detection because 
the related Internet system is not fully trustable. The goal is to reduce miscarriage of justice and get the chance to submit papers 
that were not copied and plagiarized. When the repetition rate of the same papers which is detected in different sites has 
a huge difference, a comprehensive weight checking method is adopted in this paper. This paper adds artificial judgments to the 


repeated results and reduces the Impact of the website. As a result, the checking results are not completely controlled by website 


or manual work. The website and artificial double hybrid detection of papers makes up the influence of the website resource 


= 一 library on the result of checking the weight, and improves the accuracy and credibility of the checking result. 


Key words: graduation thesis; duplicate checking website; manual detection; plagiarism 


如 下 ， 尽 管 查 重 网 站 对 整体 教育 做 到 帮 补 的 功用 ， 从 相似 性 上 
可 以 挑选 出 疑似 抄袭 的 论文 ， 依 照 不 同 网 站 所 收藏 的 数据 库 内 
前 国内 的 许多 高 校 在 学 生 毕 业 之 前 都 会 要 求学 生 撰写 毕 。 容 决 定 相似 性 的 百分比 。 此 时 ， 在 不 同 查 重 机 制 下 所 产生 的 重 
业 论 文 ， 目 的 乃 在 培养 学 生 在 此 过 程 得 到 整体 知识 的 理解 、 验 ， 复 比例 不 见得 相同 ， 重 复 比 例 高 的 也 不 能 确定 它 的 真实 性 上 1。 
证 、 和 写作 的 能 力 。 然 而 ， 尽 管 指导 老师 很 认真 地 提供 题目 与 ” 换 名 话说， 传统 查 重 网 站 的 目的 倾向 找 出 相同 文字 的 功能 ， 
指导 学 生 ， 对 毕业 论文 内 容 的 掌控 上 ， 仍 然 无 法 完整 巨细 摩 遗 ”法 防止 或 误 认 的 状况 。 所 以 ， 本 论文 强调 降低 误 认 的 作法 ， 将 
地 检验 每 位 学 生 的 研究 成 果 。 也 就 是 说 ， 面 对 学 生 论 文 抄袭 的 对 既 有 查 重 方 式 进行 分 析 与 建议 ， 进 而 提出 一 种 新 的 论文 查 
部 分 , 仍 是 有 所 欠缺 趾 。 所 幸 在 互联 网 中 发 达 的 今天 , 许多 学 校 ” 重 流 程 与 架构 。 
为 了 确保 客观 地 评分 都 会 先 交 给 查 重 网 站 ， 让 一 些 网 站 做 先期 
的 筛选 以 便 取 得 论文 相似 性 的 检验 B4 。 
故此 ， 衍 生 一 些 商机 与 问题 。 商 机 部 分 ， 许 多 查 重 网 站 的 一 般 情况 下 , 检查 抄袭 的 过 程 ， 可 以 分 成 几 种 状况 : 真 的 抄 
建立 ， 有 免费 的 查 重 网 站 7 与 付费 的 查 重 网 站 (8 站 ， 主 要 提供 。” 袭 被 找 出 ;没有 抄袭 被 找 出 ; 真 的 抄 缆 没 被 找 出 ， 这 种 状况 代表 
作者 或 是 相关 机 构 对 特定 论文 内 容 做 审查 09。 产 生 的 问题 说 明  ” 查 重 网 站 的 数据 库 量 不 足 或 是 被 抄 秦 的 对 象 没 有 被 收纳 入 查 重 
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网 站 ;没有 抄袭 
是 所 期 待 的 
帮 补 指导 老师 或 是 总 
文章 或 是 该 网 站 的 算法 涵盖 本 


日 


例 越 高 越 好 吗 ? 这 个 是 我 们 质疑 的 ， 
那么 自然 就 可 以 提升 
决 两 个 问题 :针对 没有 抄袭 被 找 出 的 六 
多 少 才 是 可 靠 的 问题 。 

对 于 以 上 的 问题 ， 本 文 提 H 
析 数 种 方法 修改 参考 文献 与 文章 , 使 之 降低 查 习 


虽 以 上 四 种 状况 ， 第 一 类 状况 正 
文章 的 作者 确实 有 抄袭 也 被 找 出 ， 如 此 便 能 


审 的 失误 。 第 三 类 受 限 了 


题 ， 是 有 可 能 发 生 
也 没 被 找 出 。 然 
没有 抄袭 却 被 评 

除 此 之 外 ， 
相同 ,查寻 


j 第 二 类 的 情况 才 是 所 关心 


F 特定 数据 库 内 部 
状况 属于 网 站 本 身 的 问 
的 结果 ， 没 有 抄袭 
的 ， 文 章 作者 本 身 
判 为 抄袭 。 

于 每 个 查 重 网 站 所 使 用 的 算法 与 数据 库 都 不 
列 也 就 不 同 G8l。 那么 该 听 谁 


的 呢 ? 碍 重 结果 比 


E 复 率 。 总 结 以 上 


要 以 较 严 格 的 算法 
内 容 ， 此 篇 论文 将 要 解 
况 来 给 予 协助 ; 查 重 比例 


了 如 下 几 点 : a) 分 


修改 数 入 


有 具 可 靠 怕 


的 查 重 比例 。 对 产生 的 样本 文章 ， 
站 先行 分 析 差 异 后 ， 输 入 免费 查 引 


的 误 判 机 会 ,如 


统计 方法 与 归纳 法 分 析 
针对 目前 的 查 重 网 
取得 输出 结果 做 多 


次 实验 。 设 计 多 种 状态 与 实验 方法 ， 最 后 呈现 整体 的 关系 并 提 


出 结论 。 


2 ”系统 架构 与 方法 


2.1 国内 查 重 网 站 的 分 类 和 描述 

查 重 网 站 ,通过 实际 测试 总 
准确 度 高 ， 查 
则 费用 少 、 检 测速 度 


针对 


了 各 个 查 重 网 站 的 优 人 
度 快 ， 但 是 查询 价格 偏 襄 


[a| 
[| 


结 
1 


快 、 准 确 度 较 高 ， 但 是 不 能 识别 论文 
文 收录 非常 地 少 , 使 用 
但 是 资源 量 较 少 ; 
论文 ， 重复 点 比 对 效率 高 ， 
准确 性 中 等 ，e) 知识 产权 卫士 - 拷 克 网 09 提 1 


各 速 


的 表格 ， 其 他 外 语 的 论 
| 网 [ml 检测 费用 低 ， 
可 实时 在 线 修改 


仿 测 论文 的 相似 度 , 提 


屿 


是 不 能 检测 英文 ， 
许多 网 页 数据 基 
{抄袭 检测 报告 , 支持 英文 检测 ， 
FP 国 搜 文章 照妖镜 
行 检测 和 判定 , 且 可 以 检测 抄袭 量 ， 
测 网 站 功能 较 差 ， 检 议 


全 确 性 较 低 ; g) 大 雅 


费 提 供 检测 ， 旧 
FE 有限, 查询 结果 仅 供 参考 ; 


| 每 天 查询 不 限 次 数 ， 查 询 速度 快 ， 但 是 其 
h) 格子 达 上 免费 提供 检测 ， 


检测 结果 


力 能 ， 但 是 不 能 检测 英文 ， 资 


源 库 不 全 面 ， 


过 高 抄 效 率 偏 低 ; i) 


PaperFree03l 可 以 准确 地 查 到 论文 中 的 洪 在 抄袭 和 不 当 引 用 ， 


可 以 边 修改 边 检 测 
不 改 的 内 容 不 收费 , 但 是 其 


限 字 数 引 


但 是 数据 资源 划 
速度 快 ， 还 提供 


期 刊 资源 库 和 互联 


实际 修改 句子 收费 ， 
EE 不 是 非常 严格 ; j ) 论文 狗 04 不 
网 实时 更 新 资源 ， 
住 确 ; k) PaperTestDsl 检 测 
修改 建议 ， 但 是 数据 文献 不 是 特别 广泛 。 


论文 输入 


谢 兆 贤 ， 等 : 


2.2 系统 架构 
如 图 1 所 示 ， 进 入 查 避 


网 站 查 重 的 一 般 过 程 为 首先 在 查 重 
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输入 数据 型 
态 与 做 法 


分 别 得 到 对 应 的 查 


图 1 系统 处 理 基本 流程 

图 2 为 论文 投入 免费 查寻 
本 文 的 做 法 是 将 同一 篇 论文 分 别 输入 A、B、 
数据 结果 a、b、 和 c，, 将 


行 比 较 ， 发 现 查 习 


E 中 输入 数据 形态 与 做 法 ， 然 后 查 
公文， 最 后 输出 数据 形态 与 做 法 ， 


里; 


三 部 分 。 


系统 处 理 | 
方 


图 2 


查 习 


重 系统 按照 一 定 的 
即 输出 查 重 结果 ， 
重复 率 部 分 和 重复 的 来 源 等 信息 。 整 体 过 程 可 以 简略 成 输 
方式 和 输 昌 


输出 数据 型 | 


前 查 重 的 架构 下 ,本文 发 展 


重 (new check re 


库 


词 ， 对 每 一 个 词 建立 一 个 索引 ， 


a 


的 检索 字 表 查 字 的 过 


个 改进 版 的 查 重 架构 ， 
peat，NCP) 的 架构 ， 如 图 3 所 示 。 
构 包 括 以 下 五 个 方面 : 
采集 层 。 采 集 层 中 包括 
查 


个 输入 模块 。 用 户 通过 输入 模 
重 的 稿件 输入 ， 作 为 系统 采集 信息 的 入 口 。 


用 领域 的 通用 数 扫 
库 ， 全 文 检索 是 计算 机 程序 通过 扫 


数据 层 。 数 据 层 包括 数据 库 和 全 文 检索 系统 。 数 据 库 是 
里 系统 ， 是 组 织 、 存 储 和 管理 
描 文章 中 的 每 一 个 


前 明 该 词 在 文章 中 出 现 的 次 数 
当 用 户 查 询 时 根据 建立 的 索引 查找 ， 类 似 于 通过 字典 


立 起 来 的 ， 将 用 于 提供 全 文 检索 月 


c) 处 理 层 。 处 理 层 包括 


是 查 重 网 站 根 


d) 核心 业务 


居 一 定 的 算法 计算 出 


袭 检查 。 通 过 该 模块 可 得 到 稿件 


测试 模块 是 将 同一 篇 稿件 
比 对 ， 并 


} 程 ， 全 文 检索 系统 是 按照 全 文 检索 理论 建 
系统 。 

算 模块 。 查 询 计算 模块 
E 复 率 ， 进 行 稿件 抄 
E 复 的 来 源 等 信息 。 
层 ,核心 业务 层 包 括 测 试 模块 和 信人 工 判断 模块 。 


重 网 站 得 到 的 重复 率 进 
间断 查 重 结果 ; 人 工 判 断 模块 是 将 稿件 进行 人 
工 复合 审查 ， 判 断 重 复 率 。 

重 系统 服务 的 用 广 


理 单位 、 杂 志 社 、 大 学 和 公众 等 。 


F 投 入 不 同 的 查 


新 闻 出 版 管理 单位 、 
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大 学 


人 工 判断 模块 


ED 


图 3 


新 型 查 重 架构 图 


23 方法 


经 过 查 重 实验 的 分 析 ， 得 出 一 个 新 的 查 重 流程 图 
所 示 ) 来 提高 论文 查 重 的 准确 性 ， 尽 量 防止 误 判 情况 的 发 生 。 


(如 图 4 


tr 


图 4 


查 重 流程 图 


具体 的 查 重 流程 为 ， 先 通 


过 输入 模块 将 需要 查 重 的 论文 输 


入 查 重 网 站 A， 青 把 论文 输入 查 重 网 站 B， 通 过 查询 计算 模块 


进行 数据 库 和 全 文 检索 可 得 网 站 A 测 得 该 论文 的 重复 率 为 A- 
R， 网 站 B 测 得 该 论文 的 重复 率 为 B-R。 然 后 测试 模块 进行 判 
断 , 如 果 A-R 和 B-R 都 小 于 20% (中 国 
答 中 提 到 “ 抄袭 过 多 ， 一 经 查 出 超过 20%， 后 果 严 重 ”091， 基 


鸣 网 在 期 刊 论文 百科 问 


此 这 里 取 值 20% 作 为 判断 依据 ) ， 表 明 两 个 网 站 一 致 认为 该 论 

文 重 复 率 低 ， 则 判定 该 论文 的 重复 率 为 R2 如 下 所 示 。 
R2=axmax{A— R,B—R}+ 
(1—-a)xmin{A—R,B—R} (D) 


其 中 : 
水 |X 间 时 ， 


a 是 置信 度 ， 为 


区 间 长 度 越 小 ， 越 准确 ;置信 度 取得 越 高 


个 事先 给 定 值 ， 一 般 来 说 ， 取 对 


ChinaXiv 合 作 期 刊 


谢 兆 贤 ， 等 : 一 种 综合 性 论文 查 重 评估 方法 


计 的 可 信 程度 越 高 ， 但 区 间 估 计 的 精确 度 会 降低 RH。 这 里 a 的 
值 由 毕业 论文 审查 人 根据 论文 实际 情况 决定 ， 通 常 根据 统计 学 
取 95% 的 置信 度 20。 在 计算 R2 值 时 ， 因 为 数值 较 大 的 查 重 结 
果 意 味 着 该 网 站 收录 有 更 多 与 输入 论文 有 关 的 资源 ， 对 查 重 结 
果 影 响 较 大 ， 可 信和 度 较 高 ， 所 以 把 较 大 的 权重 a 赋 给 较 大 的 重 
复 率 ， 考 虑 到 另 一 个 网 站 对 查 重 结果 也 有 一 定 影响 ， 所 以 把 较 
小 的 权重 (1- a ) 赋 给 较 小 的 重复 率 P2 。 
否则 ， 计 算 A-R 和 B-R 间 的 差 值 C， 如 果 C 小 于 a/2， 表 
上 两 个 网 站 的 查 重 结果 误差 在 允许 范围 之 内 ， 则 判定 该 论文 的 
重复 率 为 R2; 否则 ， 加 入 人 工 判断 该 论文 的 重复 率 HH 作为 参 
考 ， 则 判定 该 论文 的 重复 率 为 R1， 如 下 所 示 。 
RI1=80%xH+20%xaxmax{A-R,B-R}+ 
20%x(1-a)xmin{A-R,B-R} 

式 中 的 a 的 意义 同 式 (1) 。 在 计算 Rl 值 时 ， 因 为 重复 率 不 能 
超过 20%， 所 以 把 80% 的 权重 赋值 给 人 工 判定 的 重复 率 H， 其 意 
义 在 于 即使 网 站 判定 论文 为 完全 抄袭 ， 只 要 审核 该 论文 的 专家 
根据 经 验 确 定 其 为 未 抄袭 论文 ， 该 论文 仍 可 被 判定 为 未 抄袭。 

图 4 的 查 重 流程 范例 如 下 。 先 将 需要 查 重 的 论文 输入 查 重 
网 站 A， 网 站 A 测 得 该 论文 的 重复 率 A-R=15%， 再 把 论文 输 
入 查 重 网 站 B, 网 站 B 测 得 该 论文 的 重复 率 B-R=80%。 由 于 B- 
R=80%>20% ， 计 算 重 复 率 差 值 C=|(A-R)-(B-R)F|15%- 
80%|=65%，C=65%> a /2=47.5% (此 处 a 取 95%) ， 然 后 进行 
人 工 判断 。 人 工 判断 重复 率 H=18%， 则 该 论文 重复 为 
Rl=80%xH+20%xaxmax{A-R,B-R}+20%x(1-a)xmin{(A-R,B-R} 

=80%x18%+20%x95%x80%+20%x(1—95%)x15% 

= 29.75% > 20% 


结果 可 得 该 论文 重复 率 较 高 ， 判 定 为 抄袭 论文 性 质 。 
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3.1 实验 内 容 

现 取 一 篇 名 为 《帮助 高 中 生 渡 过 数学 学 习 困难 期 的 几 点 尝 
试 》[3] 的 论文 ， 对 论文 做 四 种 改动 ， 只 改 公 式 、 有 意义 地 改 文 
字 、 无 意义 地 改 文字 和 改 排版 。 

引 只 改 公式 - 改 公 式 前 和 改 公 式 后 。 改 公式 是 指 改变 论文 中 
公式 的 数字 、 运 算 符 号 、 算 法 、 函 数 、 人 逻辑 等 方面 的 操作 。 

D) 只 改 文字 - 改 文 字 前 和 改 文字 后 。 修 改 文字 后 会 有 两 种 状 
况 ， 一 种 是 有 意义 的 文字 ， 另 一 种 是 无 意义 的 文字 。 有 意义 地 
改 文字 是 指 通过 有 弹性 地 更 改 论文 中 的 某 些 词组 或 句子 使 得 文 
段 的 原意 改变 为 另 一 种 意思 的 操作 。 无 意义 地 改 文字 是 指 通过 
机 械 式 地 更 改 论文 中 的 某 些 词组 或 句子 使 得 文 段 变 得 无 意义 的 
操作 。 

0) 改 排版 - 改 文字 排版 前 和 改 文字 排版 后 。 改 排版 是 指 将 文 
字 、 图 片 、 图 形 等 可 视 化 信息 元 素 在 版 面 布局 上 调整 位 置 、 大 
小 的 操作 。 实 施 此 案例 之 后 ， 或 许 会 降低 重复 率 ， 但 是 整 句 还 
是 类 似 但 不 易 阅读 与 理解 ， 容 易 造成 查 重 的 误 判 ， 这 不 是 此 篇 
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论文 所 关心 的 议题 。 此 外 ， 发 展 新 的 查 重 算法 也 不 是 此 篇 论文 
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录用 稿 谢 兆 贤 ， 等 : ee 性 论 人 
要 讨论 的 。 效 片段 总 数 M 减 去 相似 片段 数 N( 相 似 片 段 包 括 已 作 引 用 标示 
3.2 分 析 结 果 的 内 容 )， 然 后 除 以 全 文 有 效 片段 总 数 M 得 到 文章 的 自 写 率 ， 
此 篇 论文 检查 论文 重复 率 所 使 用 的 网 站 是 大 雅 回 、 中 国 搜 公式 为 (M 一 NJ/M。 复 写 率 即 全 文 相似 部 分 片段 总 字数 N 减 去 


文章 照妖镜 [和 格子 达 中 ， 这 三 个 免费 论文 查 重 网 站 是 目前 使 。 引用 片段 总 字数 C， 然 后 除 以 全 文 有 效 片 段 总 字数 M， 公 式 为 
较为 广泛 的 。 G 一 C/M。 引 用 率 即 全 文 已 加 引用 标示 的 片段 总 字数 C 除 以 
图 5 中 所 提 及 的 标准 化 〈Normalization ) ， 是 指 对 重复 率 有效 片段 总 字数 M， 公 式 C/M。 

做 数据 标准 化 处 理 。 即 在 某 一 查 重 网 站 中 ， 以 测 得 的 原文 重复 


二 


率 为 标准 ,计算 出 论文 改动 后 测 得 的 重复 率 与 原文 重复 率 之 比 。 mo 

在 四 种 原文 改动 方式 下 ， 即 只 改 公式 、 有 意义 地 改动 文字 、 无 。 “| so 

意义 地 改动 文字 和 只 改 排版 。 图 5 画 出 了 三 个 查 重 网 站 重复 率 。 |300 | assoraaoo AN ee 
标准 化 后 的 柱状 图 。 此外， 可 以 发 现 将 文章 只 改 排版 ， 中 国 搜 。 “| 20% 一 一 复 可 六 
文章 照妖镜 标准 化 后 的 数值 为 1.6， 即 只 改 排版 后 中 国 搜 文章 0 et 
照妖镜 测 得 的 重复 率 是 测试 原文 得 到 重复 率 的 1.6 倍 ， 较 大 


度 地 超出 了 原文 重复 率 。 而 其 他 网 站 在 此 情况 下 测 得 的 文章 重 
复 率 接近 测试 原文 得 到 的 重复 率 ， 因 此 中 国 搜 文章 照妖镜 比 其 
他 网 站 对 改 排版 的 操作 要 更 敏感 。 将 文章 只 改 排版 投入 中 国 搜 6 查 重 检测 
文章 照妖镜 网 站 的 方式 ， 查 重 结果 的 可 信 度 比较 低 。 此 外 ， 将 从 图 6 可 以 发 现 , 使 用 格子 达 网 站 检测 不 同方 式 更 改 后 文章 
文章 只 改 公式 时 ， 大 雅 标准 化 后 的 数值 为 0.57， 即 只 改 公式 后 。 的 重复 率 , 无 意义 地 改 文字 检测 到 的 自 写 率 最 高 为 100%; 复写 
大 雅 测 得 的 重复 率 接近 测试 原文 得 到 重复 率 的 1/2。 其 他 网 站 ” 率 最 低 为 0。 该 种 情况 较 可 能 使 得 论文 真 的 抄袭 没 被 找 出， 该 
在 此 情况 下 测 得 的 文章 重复 率 较 接近 测试 原文 得 到 的 重复 率 ， 局 洞 的 问题 将 留待 未 来 的 研究 课题 。 
因此 大 雅 网 站 比 其 他 网 站 对 只 改 公 式 操 作 要 更 敏感 。 所 以 ， 将 
文章 只 改 公式 投入 大 雅 网 站 ， 查 重 结果 可 信和 度 较 低 。 
从 一 个 网 站 对 不 同 原文 改动 方式 测 得 的 结果 来 看 ， 大 雅 网 本 文 提出 一 种 量化 查 重 的 方法 ,基于 防止 误 判 的 论文 发 生 ， 
站 对 文章 改动 后 测 得 的 重复 率 普遍 偏 低 ， 存 在 查 重 不 够 严谨 的 。 ”以 补充 互联 网 查 重 方式 的 不 足 。 明 显 地 ， 经 由 一 些 设 计 过 的 查 
可 能 ， 因 此 大 雅 网 站 查 重 可 信和 度 偏 低 。 而 格子 达 网 站 对 文章 改 ”重文 章 对 部 分 网 站 查 重 做 测试 ， 整 理 出 一 些 可 以 预期 的 论文 问 
动 后 测 得 的 重复 率 普遍 较 高 ， 因 此 格子 达 网 站 查 重 可 信和 度 有 待 。 题 比 较 其 结果 。 由 于 各 个 查 重 网 站 的 数据 库 以 及 检测 算法 的 不 
后 续 考虑 。 从 图 5 发 现 的 规律 如 下 : a) 同一 篇 文章 在 不 同 的 查 。 同 ， 导 致 同一 篇 论文 在 不 同 网 站 测 得 的 查 重 结 果 可 能 出 现 较 大 
重 系统 中 检测 出 的 重复 率 不 同 , 甚至 有 的 相差 较 大 ; b) 改 公式 、 差异 。 此 时 ， 完 全 采用 查 重 网 站 等 自动 检测 工具 来 判断 一 篇 论 
改 文字 和 改 排版 等 方式 都 会 改变 查 重 结果 ; c) 无 意义 地 改动 文 文 是 否 抄袭 是 不 准确 的 。 有 必要 加 入 人 为 判断 ， 以 降低 误 判 因 
字 对 降低 重复 率 作用 最 大 ， 只 改 排版 对 降低 重复 率 作 用 最 小 ; 素 的 影响 。 
d) 完 全 采用 查 重 网 站 等 机 械 工具 来 判断 一 篇 论文 是 否 抄袭 ， 有 
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